智能论文笔记

Explainable Mixed Data Representation and Lossless Visualization Toolkit for Knowledge Discovery

Boris Kovalerchuk , Elijah McCoy

分类：机器学习

2022-06-13

开发用于异质/混合数据的机器学习（ML）算法是一个长期存在的问题。许多ML算法不适用于混合数据，其中包括数字和非数字数据，文本，图形等以生成可解释的模型。另一个长期存在的问题是开发用于多维混合数据无损可视化的算法。 ML的进一步进展在很大程度上取决于可解释的ML算法的混合数据和多维数据的无损解释可视化。后来允许使用最终用户的视觉知识发现开发可解释的ML模型，他们可以带来培训数据中没有的宝贵领域知识。混合数据的挑战包括：（1）生成数字编码方案，用于数字ML算法的非数字属性，以提供准确且可解释的ML模型，（2）生成用于对N-D非数字数据和视觉规则发现的无损可视化的方法这些可视化。本文介绍了混合数据类型的分类，分析了它们对ML的重要性，并提出了开发的实验工具包以处理混合数据。它结合了GitHub上可用的数据类型编辑器，Viscanvas数据可视化和规则发现系统。

translated by 谷歌翻译

Vision-based Perimeter Defense via Multiview Pose Estimation

Elijah S. Lee , Giuseppe Loianno , Dinesh Jayaraman , Vijay Kumar

分类：计算机视觉 | 机器人

2022-09-25

以前在外围防御游戏中的研究主要集中在完全可观察到的环境上，在该环境中，所有玩家都知道真正的玩家状态。但是，这对于实际实施而言是不现实的，因为捍卫者可能必须感知入侵者并估计其国家。在这项工作中，我们在照片真实的模拟器和现实世界中研究外围防御游戏，要求捍卫者从视力中估算入侵者状态。我们通过域随机化训练一个基于机器学习的系统，用于入侵者姿势检测，该系统汇总了多个视图，以减少状态估计错误并适应防御策略来解决此问题。我们新介绍性能指标来评估基于视觉的外围防御。通过广泛的实验，我们表明我们的方法改善了国家的估计，最终在两场比赛中的VS-1-Intruder游戏和2-Fefenders-VS-1-Intruder游戏中最终进行了外围防御性能。

translated by 谷歌翻译

Design of a Multimodal Fingertip Sensor for Dynamic Manipulation

Andrew SaLoutos , Elijah Stanger-Jones , Menglong Guo , Hongmin Kim , Sangbae Kim

分类：机器人

2022-09-23

我们引入了一个球形指尖传感器进行动态操作。它基于气压压力和飞行时间接近传感器，并且是低延迟，紧凑且身体健壮的。传感器使用训练有素的神经网络根据压力传感器的数据来估计接触位置和三轴接触力，这些数据嵌入了传感器的聚氨酯橡胶范围内。飞行器传感器朝三个不同的外向方向面对，并且一个集成的微控制器样品以200 Hz的速度每个单个传感器。为了量化系统潜伏期对动态操作性能的影响，我们开发和分析了一个称为碰撞脉冲比率的度量，并表征了我们新传感器的端到端潜伏期。我们还向传感器提出了实验演示，包括测量接触过渡，进行粗大映射，与移动物体保持接触力以及避免碰撞的反应。

translated by 谷歌翻译

Towards Robust Autonomous Grasping with Reflexes Using High-Bandwidth Sensing and Actuation

Andrew SaLoutos , Hongmin Kim , Elijah Stanger-Jones , Menglong Guo , Sangbae Kim

分类：机器人

2022-09-23

现代的机器人操纵系统缺乏人类的操纵技巧，部分原因是它们依靠围绕视觉数据的关闭反馈循环，这会降低系统的带宽和速度。通过开发依赖于高带宽力，接触和接近数据的自主握力反射，可以提高整体系统速度和鲁棒性，同时减少对视力数据的依赖。我们正在开发一个围绕低渗透的高速手臂建造的新系统，该系统用敏捷的手指结合了一个高级轨迹计划器，以小于1 Hz的速度运行，低级自主反射控制器的运行量超过300 Hz。我们通过将成功的基线控制器和反射握把控制器的变化的成功抓Grasps的体积和反射系统的体积进行比较，从而表征了反射系统，发现我们的控制器将成功的掌握率与基线相比扩大了55％。我们还使用简单的基于视觉的计划者在自主杂波清除任务中部署了反身抓握控制器，在清除100多个项目的同时，达到了超过90％的成功率。

translated by 谷歌翻译

Can a latent Hawkes process be used for epidemiological modelling?

Stamatina Lamprinakou , Axel Gandy , Emma McCoy

分类：机器学习

2022-08-15

了解Covid-19的传播是众多研究的主题，突出了可靠的流行模型的重要性。在这里，我们使用带有时间协变量的潜在霍克斯工艺引入了一种新型的流行模型，用于建模感染。与其他模型不同，我们通过基础霍克斯过程驱动的概率分布进行对报告的案例进行建模。通过霍克斯过程对感染进行建模，使我们能够估计受感染的人感染的人。我们提出了一个内核密度颗粒滤波器（KDPF），以推断潜在病例和繁殖数，并在不久的将来预测新病例。计算工作与感染的数量成正比，使使用粒子滤波器类型算法（例如KDPF）成为可能。我们证明了拟议的算法对合成数据集的性能，而Covid-19报告了英国各个地方当局的病例，并将我们的模型基于替代方法。

translated by 谷歌翻译

Structural Biases for Improving Transformers on Translation into Morphologically Rich Languages

Paul Soulos , Sudha Rao , Caitlin Smith , Eric Rosen , Asli Celikyilmaz , R. Thomas McCoy , Yichen Jiang , Coleman Haley , Roland Fernandez , Hamid Palangi

分类：自然语言处理

2022-08-11

基于变压器的模型的出现，机器翻译已经快速发展。这些模型没有内置的明确的语言结构，但是它们仍然可以通过参与相关令牌隐式学习结构化的关系。我们假设通过明确赋予变形金刚具有结构性偏见，可以使这种结构学习变得更加健壮，我们研究了两种在这种偏见中构建的方法。一种方法，即TP变换器，可以增强传统的变压器体系结构，包括代表结构的附加组件。第二种方法通过将数据分割为形态令牌化来灌输数据级别的结构。我们测试了这些方法从英语翻译成土耳其语和Inuktitut的形态丰富的语言，并考虑自动指标和人类评估。我们发现，这两种方法中每种方法都允许网络实现更好的性能，但是此改进取决于数据集的大小。总而言之，结构编码方法使变压器更具样本效率，从而使它们能够从少量数据中表现得更好。

translated by 谷歌翻译

Fast Reflexive Grasping with a Proprioceptive Teleoperation Platform

Andrew SaLoutos , Elijah Stanger-Jones , Sangbae Kim

分类：机器人

2022-08-09

我们提出了一个本体感受的远程操作系统，该系统使用反身握把算法来增强拾取任务的速度和稳健性。该系统由两个使用准直接驱动驱动的操纵器组成，以提供高度透明的力反馈。末端效应器具有双峰力传感器，可测量3轴力信息和2维接触位置。此信息用于防滑和重新磨碎反射。当用户与所需对象接触时，重新抓紧反射将抓地力的手指与对象上的抗肌点对齐，以最大程度地提高抓握稳定性。反射仅需150毫秒即可纠正用户选择的不准确的grasps，因此用户的运动仅受到Re-Grasp的执行的最小干扰。一旦建立了抗焦点接触，抗滑动反射将确保抓地力施加足够的正常力来防止物体从抓地力中滑出。本体感受器的操纵器和反射抓握的结合使用户可以高速完成远程操作的任务。

translated by 谷歌翻译

On Label Granularity and Object Localization

Elijah Cole , Kimberly Wilber , Grant Van Horn , Xuan Yang , Marco Fornoni , Pietro Perona , Serge Belongie , Andrew Howard , Oisin Mac Aodha

分类：计算机视觉 | 机器学习

2022-07-20

弱监督的对象本地化（WSOL）旨在学习仅使用图像级类别标签编码对象位置的表示形式。但是，许多物体可以在不同水平的粒度标记。它是动物，鸟还是大角的猫头鹰？我们应该使用哪些图像级标签？在本文中，我们研究了标签粒度在WSOL中的作用。为了促进这项调查，我们引入了Inatloc500，这是一个新的用于WSOL的大规模细粒基准数据集。令人惊讶的是，我们发现选择正确的训练标签粒度比选择最佳的WSOL算法提供了更大的性能。我们还表明，更改标签粒度可以显着提高数据效率。

translated by 谷歌翻译

How much do language models copy from their training data? Evaluating linguistic novelty in text generation using RAVEN

R. Thomas McCoy , Paul Smolensky , Tal Linzen , Jianfeng Gao , Asli Celikyilmaz

分类：自然语言处理

2021-11-18

当前的语言模型可以产生高质量的文本。他们只是复制他们之前看到的文本，或者他们学习了普遍的语言抽象吗？要取笑这些可能性，我们介绍了乌鸦，这是一套评估生成文本的新颖性，专注于顺序结构（n-gram）和句法结构。我们将这些分析应用于四种神经语言模型（LSTM，变压器，变换器-XL和GPT-2）。对于本地结构 - 例如，单个依赖性 - 模型生成的文本比来自每个模型的测试集的人类生成文本的基线显着不那么新颖。对于大规模结构 - 例如，总句结构 - 模型生成的文本与人生成的基线一样新颖甚至更新颖，但模型仍然有时复制，在某些情况下，在训练集中重复超过1000字超过1,000字的通道。我们还表现了广泛的手动分析，表明GPT-2的新文本通常在形态学和语法中形成良好，但具有合理的语义问题（例如，是自相矛盾）。

translated by 谷歌翻译

A Robust Cybersecurity Topic Classification Tool

Elijah Pelofske , Lorie M. Liebrock , Vincent Urias

分类：自然语言处理 | 机器学习

2021-08-30

In this research, we use user defined labels from three internet text sources (Reddit, Stackexchange, Arxiv) to train 21 different machine learning models for the topic classification task of detecting cybersecurity discussions in natural text. We analyze the false positive and false negative rates of each of the 21 model's in a cross validation experiment. Then we present a Cybersecurity Topic Classification (CTC) tool, which takes the majority vote of the 21 trained machine learning models as the decision mechanism for detecting cybersecurity related text. We also show that the majority vote mechanism of the CTC tool provides lower false negative and false positive rates on average than any of the 21 individual models. We show that the CTC tool is scalable to the hundreds of thousands of documents with a wall clock time on the order of hours.

translated by 谷歌翻译